Présentation

Nous vous proposons, au travers cette activité, de comprendre comment les pages web peuvent être classées par votre moteur de recherche.

La plupart des pages web présentent des liens vers d’autres pages web, appelés liens hypertextes. Le principe général est que si le lien vers une page web est présent dans beaucoup d'autres pages web, cette page est considérée comme "importante" ou "populaire" et sera bien classée par les moteurs de recherche.

Pour mesurer cette popularité par un nombre, on applique l’algorithme suivant :

  • on part d’une page web au hasard (on suppose que cela n’a pas d’importance, ce qui est partiellement vrai) ;
  • sur chaque page visitée, on : clique sur un lien au hasard sur cette page (pour visiter une nouvelle page) ;
  • on répète cette étape un grand nombre de fois.

Durant l’exécution de l’algorithme, on n’oublie pas de compter le nombre de fois que chaque page a été visitée. Le score de chaque page est alors la fréquence du nombre de visites de cette page. Les pages avec le plus haut score seront visitées plus souvent que les autres.

Ce concept est celui du surfeur aléatoire.

Exemple

Le graphe "Représentation de pages web" représente un ensemble de page web, nommées A à F.
Les arêtes (flèches) représentent des liens entre les pages. Il y a une arête allant de la page B à la page F, ce qui signifie qu’il est possible, en visitant la page B, de cliquer sur un lien pour se retrouver sur la page F (ignorer les numéros pour le moment).

Source : https://lesmanuelslibres.region-academique-idf.fr
Télécharger le manuel : https://forge.apps.education.fr/drane-ile-de-france/les-manuels-libres/snt-seconde ou directement le fichier ZIP
Sous réserve des droits de propriété intellectuelle de tiers, les contenus de ce site sont proposés dans le cadre du droit Français sous licence CC BY-NC-SA 4.0